|
1.
基于远距离监督和模式匹配的职衔履历属性抽取
于东, 刘春花, 田悦
计算机应用
2016, 36 (2):
455-459.
DOI: 10.11772/j.issn.1001-9081.2016.02.0455
针对从非结构化文本中抽取指定人物职衔履历属性问题,提出一种基于远距离监督和模式匹配的属性抽取方法。该方法从字符串模式和依存模式两个层面描述人物职衔履历特征,将问题分为两阶段。首先利用远距离监督知识和人工标注知识,挖掘具有高覆盖度的模式库,用于发现职衔履历属性和抽取候选集;其次利用职衔机构等属性间的文字接续关系,以及特定人物与候选属性的依存关系,设计候选集的过滤规则对候选项进行筛选,实现高准确度的属性抽取。实验结果显示,所提方法在CLP2014-PAE测试集上的
F值达到55.37%,显著高于评测最好成绩(
F值34.38%)和基于条件随机场(CRF)的有监督序列标注方法(
F值43.79%),表明该方法能高覆盖度挖掘并抽取非结构化文档中的职衔履历属性。
参考文献 |
相关文章 |
多维度评价
|
|